反演原理
似然函数通常以联合密度的形式表示。对于方差固定的正态分布,似然函数定义为:
$L ( \theta | x_1, \dots, x_n ) = \exp\left( -\frac{n}{2\sigma_0^2} (\bar{x} - \theta)^2 \right)$
此处,我们根据样本均值 $\bar{x}$ 评估不同 $\theta$ 值的“合理性”。为找到这一合理性的峰值,我们使用 定义 6.2.2: 对数似然 $l(\theta | s) = \ln L(\theta | s)$。此变换将独立观测值乘积转化为求和,使复杂模型的最大化在计算上成为可能。
实例分析:身高调查(示例 6.3.5)
考虑一个包含 $n=30$ 个身高的样本,其计算得出的标准差为 $s=2.379$。利用位置-尺度正态模型,我们试图推断真实均值 $\theta$。
标准误计算为 $s/\sqrt{30} = 0.43434$。该值衡量了似然峰的“尖锐度”。标准误越小,峰越窄越尖锐,表明对 $\theta$ 的推断精度越高。
维度与约束
在如 示例 6.1.5(多项式模型)等复杂情形中,我们必须考虑逻辑依赖关系。正如所指出的:“请注意,它实际上只有二维,因为一旦我们知道任意两个 $\theta_i$ 的值……我们就立即知道了剩余参数的值。” 这一约束对于正确定义参数空间 $\Omega$ 至关重要。
渐近基础
从似然到推断的桥梁依赖于中心极限定理。当 $n \to \infty$ 时,我们的估计量的分布趋于收敛。具体而言,在 示例 6.5.4 伯努利模型:
$Z = \frac{\sqrt{n}(\bar{X} - \theta)}{\sqrt{\bar{X}(1 - \bar{X})}} \xrightarrow{D} N(0, 1)$
只要样本量足够大,这使得我们能够使用 z 区间和 p 值来量化不确定性。